智能论文笔记

Deep learning-based fast solver of the shallow water equations

Mojtaba Forghani , Yizhou Qian , Jonghyun Lee , Matthew W. Farthing , Tyler Hesser , Peter K. Kitanidis , Eric F. Darve

分类：机器学习

2021-11-23

在许多应用中，河流流速的快速可靠预测在包括洪水风险管理的许多应用中都很重要。浅水方程（SWES）通常用于此目的。然而，SWES的传统数值求解器是计算昂贵的并且需要高分辨率河床型材测量（沐浴浴）。在这项工作中，我们提出了一个两级过程，首先，使用主成分地质统计方法（PCGA）我们估计来自流速测量的浴序的概率密度函数，然后使用机器学习（ML）算法获得用于SWES的快速求解器。快速求解器使用从后浴碱分布的实现，并作为输入的规定范围的BCS。第一阶段允许我们预测流速而不直接测量浴约定。此外，我们将浴约集后部分布增强到更一般的分布，然后将它们作为第二阶段中的ML算法的输入作为输入。这允许求解器将未来的直接浴权测量结合到流速预测中，以提高精度，即使沐浴术与原始间接估计相比随时间变化而变化。我们提出并基准三种不同的求解器，称为PCA-DNN（主成分分析 - 深神经网络），SE（监督编码器）和SVE（监督变分编码器），并在Savannah River，Augusta，GA上验证它们。我们的研究结果表明，快速溶剂能够以良好的准确度预测不同的浴序和BCS的流速，以计算成本明显低于解决传统方法的全边界值问题的成本。

translated by 谷歌翻译

Adaptive Conformal Prediction for Motion Planning among Dynamic Agents

Anushri Dixit , Lars Lindemann , Skylar Wei , Matthew Cleaveland , George J. Pappas , Joel W. Burdick

分类：机器人

2022-12-01

This paper proposes an algorithm for motion planning among dynamic agents using adaptive conformal prediction. We consider a deterministic control system and use trajectory predictors to predict the dynamic agents' future motion, which is assumed to follow an unknown distribution. We then leverage ideas from adaptive conformal prediction to dynamically quantify prediction uncertainty from an online data stream. Particularly, we provide an online algorithm uses delayed agent observations to obtain uncertainty sets for multistep-ahead predictions with probabilistic coverage. These uncertainty sets are used within a model predictive controller to safely navigate among dynamic agents. While most existing data-driven prediction approached quantify prediction uncertainty heuristically, we quantify the true prediction uncertainty in a distribution-free, adaptive manner that even allows to capture changes in prediction quality and the agents' motion. We empirically evaluate of our algorithm on a simulation case studies where a drone avoids a flying frisbee.

translated by 谷歌翻译

Improving astroBERT using Semantic Textual Similarity

Felix Grezes , Thomas Allen , Sergi Blanco-Cuaresma , Alberto Accomazzi , Michael J. Kurtz , Golnaz Shapurian , Edwin Henneken , Carolyn S. Grant , Donna M. Thompson , Timothy W. Hostetler

分类：自然语言处理

2022-11-29

The NASA Astrophysics Data System (ADS) is an essential tool for researchers that allows them to explore the astronomy and astrophysics scientific literature, but it has yet to exploit recent advances in natural language processing. At ADASS 2021, we introduced astroBERT, a machine learning language model tailored to the text used in astronomy papers in ADS. In this work we: - announce the first public release of the astroBERT language model; - show how astroBERT improves over existing public language models on astrophysics specific tasks; - and detail how ADS plans to harness the unique structure of scientific papers, the citation graph and citation context, to further improve astroBERT.

translated by 谷歌翻译

Device Modeling Bias in ReRAM-based Neural Network Simulations

Osama Yousuf , Imtiaz Hossen , Matthew W. Daniels , Martin Lueker-Boden , Andrew Dienstfrey , Gina C. Adam

分类：机器学习

2022-11-29

Data-driven modeling approaches such as jump tables are promising techniques to model populations of resistive random-access memory (ReRAM) or other emerging memory devices for hardware neural network simulations. As these tables rely on data interpolation, this work explores the open questions about their fidelity in relation to the stochastic device behavior they model. We study how various jump table device models impact the attained network performance estimates, a concept we define as modeling bias. Two methods of jump table device modeling, binning and Optuna-optimized binning, are explored using synthetic data with known distributions for benchmarking purposes, as well as experimental data obtained from TiOx ReRAM devices. Results on a multi-layer perceptron trained on MNIST show that device models based on binning can behave unpredictably particularly at low number of points in the device dataset, sometimes over-promising, sometimes under-promising target network accuracy. This paper also proposes device level metrics that indicate similar trends with the modeling bias metric at the network level. The proposed approach opens the possibility for future investigations into statistical device models with better performance, as well as experimentally verified modeling bias in different in-memory computing and neural network architectures.

translated by 谷歌翻译

How to Deploy a 10-km Interferometric Radio Telescope on the Moon with Just Four Tethered Robots

Patrick McGarey , Issa A. Nesnas , Adarsh Rajguru , Matthew Bezkrovny , Vahraz Jamnejad , Jim Lux , Eric Sunada , Lawrence Teitelbaum , Alexander Miller , Steve W. Squyres

分类：机器人

2022-09-06

对黑暗时代和系外行星（Farside）进行无线电科学调查的遥远阵列是对Lunar Far Side的拟议任务概念，试图在100正方形的区域内部署和操作128双极化的阵列，偶极天线公里。所得的干涉射电望远镜将提供遥远恒星系统的前所未有的无线电图像，从而可以研究冠状质量弹出和能量颗粒事件的微弱无线电特征，还可以导致在其母星的居住区内检测到磁层周围的磁层。同时，Farside还将在一系列红移（z大约50-100）中以全球21厘米信号的全局信号来测量早期宇宙的“黑暗年龄”。阵列中的每个离散天线节点都通过通信和电源系绳连接到中央集线器（位于降落器）。节点是由Cold =可操作的电子设备驱动的，该电子设备连续监测极宽的频率（200 kHz至40 MHz），该频率超过了基于地球的望远镜的能力，该望远镜的功能由两个数量级。实现这种开创性的能力需要在月球表面上制定强大的部署策略，这对于现有高的TRL技术（演示或正在积极发展）是可行的，并且能够在下一代商业地面上传递到地表，例如蓝色Origin的蓝月亮着陆器。本文介绍了一种天线包装，放置和表面部署贸易研究，该研究利用了NASA的Jet Propuls实验室开发的束缚移动机器人的最新进展，该机器人用于部署平坦的，天线隔离的，带有光学通信和电源传输的磁带。功能。

translated by 谷歌翻译

Deep Neural Imputation: A Framework for Recovering Incomplete Brain Recordings

Sabera Talukder , Jennifer J. Sun , Matthew Leonard , Bingni W. Brunton , Yisong Yue

分类：机器学习 | 神经与进化计算 | (统计)机器学习

2022-06-16

神经科学家和神经工具长期以来一直依赖多电极神经记录来研究大脑。但是，在典型的实验中，许多因素损坏了来自单个电极的神经记录，包括电噪声，运动伪像和制造错误。当前，普遍的做法是丢弃这些损坏的录音，减少已经有限的数据，难以收集。为了应对这一挑战，我们提出了深层神经插补（DNI），这是一个从跨空间位置，天和参与者中收集的数据中学习的框架，以从电极中恢复缺失值。我们通过线性最近的邻居方法和两个深层生成自动编码器探索我们的框架，证明了DNI的灵活性。一位深度自动编码器单独建模参与者，而另一个则扩展了该体系结构以共同建模。我们评估了12名用多电极内电图阵列植入的人类参与者的模型；参与者没有明确的任务，并且在数百个记录小时内自然行为。我们表明，DNI不仅恢复了时间序列，还可以恢复频率内容，并通过在科学相关的下游神经解码任务上恢复出色的性能来进一步确立DNI的实际价值。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

The CAMELS project: public data release

Francisco Villaescusa-Navarro , Shy Genel , Daniel Anglés-Alcázar , Lucia A. Perez , Pablo Villanueva-Domingo , Digvijay Wadekar , Helen Shao , Faizan G. Mohammad , Sultan Hassan , Emily Moser

分类：人工智能 | 机器学习

2022-01-04

制定了具有机器学习模拟（骆驼）项目的宇宙学和天体物理学，通过数千名宇宙的流体动力模拟和机器学习将宇宙学与天体物理学结合起来。骆驼包含4,233个宇宙学仿真，2,049个n-body和2,184个最先进的流体动力模拟，在参数空间中采样巨大的体积。在本文中，我们介绍了骆驼公共数据发布，描述了骆驼模拟的特性和由它们产生的各种数据产品，包括光环，次麦，银河系和空隙目录，功率谱，Bispectra，Lyman - $ \ Alpha $光谱，概率分布函数，光环径向轮廓和X射线光子列表。我们还释放了超过骆驼 - 山姆的数十亿个星系的目录：与Santa Cruz半分析模型相结合的大量N身体模拟。我们释放包含350多个Terabytes的所有数据，并包含143,922个快照，数百万光环，星系和摘要统计数据。我们提供有关如何访问，下载，读取和处理数据AT \ URL {https://camels.readthedocs.io}的进一步技术详细信息。

translated by 谷歌翻译

Implementation of a Binary Neural Network on a Passive Array of Magnetic Tunnel Junctions

Jonathan M. Goodwill , Nitin Prasad , Brian D. Hoskins , Matthew W. Daniels , Advait Madhavan , Lei Wan , Tiffany S. Santos , Michael Tran , Jordan A. Katine , Patrick M. Braganca

分类：机器学习

2021-12-16

神经网络的越来越大的规模及其越来越多的应用空间对更高的能量和记忆有效的人工智能特定硬件产生了需求。 venues为了缓解主要问题，von neumann瓶颈，包括内存和近记忆架构，以及算法方法。在这里，我们利用磁隧道结（MTJ）的低功耗和固有的二进制操作来展示基于MTJ的无源阵列的神经网络硬件推断。通常，由于设备到装置的变化，写入误差，寄生电阻和非前沿，在性能下将训练的网络模型转移到推动的硬件。为了量化这些硬件现实的效果，我们将300个唯一重量矩阵解决方案的23个唯一的重量矩阵解决方案进行分类，以分类葡萄酒数据集，用于分类准确性和写真保真度。尽管设备不完美，我们可以实现高达95.3％的软件等效精度，并在15 x 15 MTJ阵列中正确调整具有一系列设备尺寸的阵列。此调谐过程的成功表明，需要新的指标来表征混合信号硬件中再现的网络的性能和质量。

translated by 谷歌翻译

Building astroBERT, a language model for Astronomy & Astrophysics

Felix Grezes , Sergi Blanco-Cuaresma , Alberto Accomazzi , Michael J. Kurtz , Golnaz Shapurian , Edwin Henneken , Carolyn S. Grant , Donna M. Thompson , Roman Chyla , Stephen McDonald

分类：自然语言处理

2021-12-01

用于探索美国国家航空航天局的搜索工具（广告）可以相当丰富和赋予（例如，类似和趋势的运营商），但研究人员尚未允许完全杠杆语义搜索。例如，对“普朗克任务的结果”查询应该能够区分普朗克（人，任务，常量，机构和更多）的所有各种含义，而无需从用户进一步澄清。在广告中，我们正在将现代机器学习和自然语言处理技术应用于我们最近的天文出版物的数据集，以培训Astrobert，这是一种基于Google研究的深刻语境语言模型。使用AstrBert，我们的目标是丰富广告数据集并提高其可发现性，特别是我们正在开发自己的命名实体识别工具。我们在这里展示我们初步的结果和经验教训。

translated by 谷歌翻译